Статья 1219

Название статьи

СОВРЕМЕННЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ ПОСТРОЕНИЯ ГОЛОСОВОГО
ИНТЕРФЕЙСА УПРАВЛЕНИЯ СИСТЕМАМИ СПЕЦИАЛЬНОГО НАЗНАЧЕНИЯ 

Авторы

Алексеев Илья Владимирович, аспирант, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: aius@pnzgu.ru
Митрохин Максим Александрович, доктор технических наук, заведующий кафедрой вычислительной техники, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), E-mail: vt@pnzgu.ru 

Индекс УДК

004.934 

DOI

10.21685/2072-3059-2019-2-1 

Аннотация

Актуальность и цели. Объектом исследования являются современные технологии распознавания речи. Предмет исследования – методы построения и обучения систем распознавания речи. Целью работы является анализ современных технологий распознавания речи на примере некоторых систем для определения возможности их применения в голосовом интерфейсе управления системами специального назначения.
Материалы и методы. Исследования выполнены с использованием методов теории вероятностей и методов распознавания образов.
Результаты. Проведен анализ требований и ограничений функционирования интерфейсов управления системами специального назначения. Рассмотрены основные аспекты реализации систем распознавания речи и некоторые особенности различных технологий определения структурных единиц речи.
Выводы. Рассмотренные технологии распознавания речи потенциально применимы в интерфейсах управления специальных систем, но требуются дополнительные исследования по оценке их эффективности. 

Ключевые слова

пользовательский интерфейс, речевой интерфейс, скрытые марковские модели, нейронные сети, распознавание речи 

 

 Скачать статью в формате PDF

Список литературы

1. Хайкин, С. Нейронные сети: полный курс : пер. с англ. / С. Хайкин. – 2-e изд., испр. – Мoсква : Вильямс, 2006. – 1104 с.
2. Тампель, И. Б. Автоматическое распознавание речи – основные этапы за 50 лет / И. Б. Тампель // Научно-технический вестник информационных технологий, механики и оптики. – 2015. – Т. 15, № 6. – С. 957–968.
3. Huang, X. Spoken language processing: a guide to theory, algorithm, and system development / X. Huang, A. Acero. – Prentice Hall, 2001. – 1008 p.
4. Bourlard, H. Towards increasing speech recognition error rates / H. Bourlard, H. Hermansky, N. Morgan // Speech Communication. – 1996. – Vol. 18, № 3. – P. 205–231. – DOI 10.1016/0167-6393(96)00003-9 

 

Дата создания: 20.05.2019 10:20
Дата обновления: 16.09.2019 08:32